Aller au contenu principal
Fermer

Le nouvel assistant IA de Meta s'est entraîné sur les posts publics de Facebook et d'Instagram
information fournie par Reuters 29/09/2023 à 04:55

(Plus de détails sur les données utilisées pour la formation) par Katie Paul

MENLO PARK, Californie, 29 septembre (Reuters) - Meta Platforms META.O a utilisé des posts publics de Facebook et d'Instagram pour entraîner certaines parties de son nouvel assistant virtuel Meta AI, mais a exclu les posts privés partagés uniquement avec la famille et les amis dans un effort pour respecter la vie privée des consommateurs, a déclaré le principal responsable politique de l'entreprise lors d'une interview avec Reuters.

Meta n'a pas non plus utilisé les chats privés sur ses services de messagerie comme données d'entraînement pour le modèle et a pris des mesures pour filtrer les détails privés des ensembles de données publiques utilisés pour l'entraînement, a déclaré Nick Clegg, président des affaires mondiales de Meta, en marge de la conférence annuelle Connect de l'entreprise cette semaine.

"Nous avons essayé d'exclure les ensembles de données qui contiennent une forte prépondérance d'informations personnelles", a déclaré M. Clegg, ajoutant que la "grande majorité" des données utilisées par Meta pour la formation étaient accessibles au public.

Il a cité LinkedIn comme exemple de site web dont Meta a délibérément choisi de ne pas utiliser le contenu pour des raisons de protection de la vie privée.

Les commentaires de M. Clegg interviennent alors que des entreprises technologiques telles que Meta, OpenAI et Alphabet

GOOGL.O Google ont été critiquées pour avoir utilisé sans autorisation des informations extraites d'Internet afin d'entraîner leurs modèles d'IA, qui ingèrent des quantités massives de données afin de résumer des informations et de générer des images.

Les entreprises réfléchissent à la manière de traiter les documents privés ou protégés par des droits d'auteur que leurs systèmes d'IA pourraient reproduire, tout en faisant face à des poursuites de la part d'auteurs qui les accusent de violer des droits d'auteur.

Meta AI était le produit le plus important parmi les premiers outils d'IA destinés aux consommateurs, dévoilés par le directeur général Mark Zuckerberg mercredi lors de la conférence annuelle de Meta sur les produits, Connect. Cette année, l'événement a été dominé par des discussions sur l'intelligence artificielle, contrairement aux conférences précédentes qui se concentraient sur la réalité augmentée et virtuelle.

Meta a créé l'assistant en utilisant un modèle personnalisé basé sur le puissant modèle linguistique Llama 2 que la société a mis à la disposition du public en juillet, ainsi qu'un nouveau modèle appelé Emu qui génère des images en réponse à des invites textuelles, a indiqué la société.

Le produit sera capable de générer du texte, du son et des images et aura accès à des informations en temps réel grâce à un partenariat avec le moteur de recherche Bing de Microsoft

MSFT.O .

Les posts publics de Facebook et d'Instagram qui ont été utilisés pour entraîner Meta AI comprenaient à la fois du texte et des photos, a précisé M. Clegg.

Ces posts ont servi à entraîner Emu pour les éléments de génération d'images du produit, tandis que les fonctions de chat étaient basées sur Llama 2 avec quelques ensembles de données annotées et disponibles publiquement ajoutées, a déclaré un porte-parole de Meta à Reuters.

Les interactions avec Meta AI peuvent également être utilisées pour améliorer les fonctions à l'avenir, a déclaré le porte-parole.

M. Clegg a déclaré que Meta avait imposé des restrictions de sécurité sur le contenu que l'outil Meta AI pouvait générer, comme l'interdiction de créer des images photoréalistes de personnalités publiques.

En ce qui concerne les documents protégés par le droit d'auteur, M. Clegg a déclaré qu'il s'attendait à un "grand nombre de litiges" sur la question de savoir "si le contenu créatif est couvert ou non par la doctrine de l'utilisation équitable", qui permet l'utilisation limitée d'œuvres protégées à des fins telles que le commentaire, la recherche et la parodie.

"Nous pensons que c'est le cas, mais je soupçonne fortement que cette question fera l'objet d'un litige", a déclaré M. Clegg.

Certaines entreprises disposant d'outils de génération d'images facilitent la reproduction de personnages emblématiques tels que Mickey Mouse, tandis que d'autres ont payé pour les matériaux ou ont délibérément évité de les inclure dans les données d'entraînement.

OpenAI, par exemple, a signé cet été un accord de six ans avec le fournisseur de contenu Shutterstock pour utiliser les bibliothèques d'images, de vidéos et de musique de l'entreprise à des fins de formation.

À la question de savoir si Meta avait pris de telles mesures pour éviter la reproduction d'images protégées par le droit d'auteur, un porte-parole de Meta a indiqué que les nouvelles conditions d'utilisation interdisaient aux utilisateurs de générer des contenus violant la vie privée et les droits de propriété intellectuelle.

Valeurs associées

302,7700 USD NASDAQ +0,59%
606,6299 USD NASDAQ +2,18%
382,8227 USD NASDAQ +0,25%

0 commentaire

Signaler le commentaire

Fermer

A lire aussi

Mes listes

Cette liste ne contient aucune valeur.
Chargement...